iT邦幫忙

2023 iThome 鐵人賽

DAY 10
0
自我挑戰組

ChatGPT!啟動!系列 第 10

Day-10 有圖有真相-DALL-E、Michelangelo、MixerBox ImageGen

  • 分享至 

  • xImage
  •  

0. 前言

昨天我們使用了image search跟gif search這兩個plugin來搜尋圖片跟GIF,但是搜尋結果有時候差強人意,這個時候就來試試自己做圖片吧!今天要使用Michelangelo和其他插件來帶大家認識OpenAI的另一個強項:Dall-E模型。



1. DALL-E、DALL-E2

DALL-E和DALL-E 2是由OpenAI使用深度學習方法開發的文本到圖像模型。這些模型能夠根據prompts生成數字圖像。DALL-E最初於2021年1月公開,並使用了一個修改過的GPT-3版本來生成圖像。2022年4月,OpenAI宣布了DALL-E 2並於2022年7月20日進入了beta階段。此外DALL-E 2也作為API發布,允許開發者將模型集成到他們自己的應用程序中。(API部分將會在最後五天解說)

  1. 軟件的名稱
    • 是動畫機器人角色 WALL-E 和西班牙超現實主義藝術家 Salvador Dalí 名稱的拼音。
  2. 能力
    • DALL-E 可以生成多種風格的圖像,包括照片般逼真的圖像、繪畫和表情符號。它可以正確地在新穎的組合中放置設計元素,而不需要明確的指示。
  3. 倫理問題
    • DALL-E 2 的訓練數據經過過濾以去除暴力和性圖像,但這在某些情況下會增加偏見。
  4. 技術限制
    • DALL-E 2 的語言理解有限,有時無法區分 "A yellow book and a red vase" 和 "A red book and a yellow vase"。
  • 如果想直接從OpenAI官網的DALL-E玩玩看也行,不過需要另外付費,他每次生成都要花credits,而且一次買就要花15美元買115點credits(豪貴>_<)
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090HAUqlgCJcA.png

1.1. 使用

  • 這邊讓大家稍微看一下會長怎樣,我輸入的prompt是:A futuristic neon lit weapon,翻譯是霓虹燈效果的武器
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090aNWSKtQG27.png
  • 它會生成四張圖片給你,選一張喜歡的點進去,可以看到右上角有EditVariationsShareSave,後面兩個選項應該不用多說,就稍微解釋前面兩個好了。
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090ZKpuHWrDfP.png
  1. Edit
  • 它會給你一個橡皮擦(?)你可以把不滿意的地方擦掉,它會重新在你擦掉的位置生成圖像,其餘則不會改變。
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090fhjAidACbO.png
  • 擦完一樣按Generate,消耗一點credits它又會給你四張圖片(包括原圖共五張)
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090rNmvUg8Y5O.png
  1. Variations
  • Edit不同的是,Variations會直接以這張圖片的風格元素重新再給你四張(同樣包括原圖共五張)
    https://ithelp.ithome.com.tw/upload/images/20230920/201620900c5THg9pGH.png

  • 旁邊的歷史紀錄可以看到我其實試了很多不同主題,對於他的生成圖片能力我只能說時好時壞,可能是因為我不會下文生圖的prompts或是官網的可調選項比較有限制,所以我是不推薦花這15美,或是可以使用接下來要介紹的插件玩玩看再決定。



2. Michelangelo

  • 這個插件是基於DALL-E模型運作的,並且我在一開始向他詢問如何使用及應該如何給他prompt(Day-4提到的小祕訣:問它如何給prompt),他的回應如下
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090BCwaHr00CV.png
  • 可以看到有一個重點要素是選擇風格,所以我除了主題和服女孩以外,還指定了動漫風格
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090x52sRhUjWF.png
  • 啊?和服呢?結果我的和服完全消失了,所以我又問了一次,然後他就回應用完本月的五次使用額度了QwQ(之前的測試亂玩用了四次)
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090Td5wknmbD2.png
  • 但我覺得已經很好了,畢竟是免費讓你使用的插件,而且圖片品質也不低。


3. MixerBox ImageGen

  • 嘿對這個工具從名稱上就能看出來跟前面那些Mixer開頭的插件一樣,都是MixerBox導流打廣告的產品,所以說實在我原本對他的期望不太高,直到他回應生成的圖片後我稍微改觀了,看起來好像效果不錯的樣子OwO
    https://ithelp.ithome.com.tw/upload/images/20230920/20162090bPtJyWooZ9.png
  • 到網頁查看圖片,發現MixerBox果然還是死性不改,在圖片加了一堆浮水印=_=。不過至少生成的圖片元素該有的都有,算是差強人意。
    https://ithelp.ithome.com.tw/upload/images/20230920/201620909ZtasM5Yfo.png


4. 結語

今天除了介紹OpenAI自家的DALL-E以外還玩了兩個插件MichelangeloMixerBox ImageGen,效果其實都不錯,但就是讓我感覺到文生圖的prompts精準度必須比平常使用ChatGPT高,否則就會生出一堆四不像的怪物。以後有機會再來介紹我曾經玩過的Midjourny和Stable Diffusion,有興趣當然也歡迎大家自行研究,然後跟我們分享哦~


HackMD頁面

上一篇
Day-9 沒圖沒真相-image search、GIF Search
下一篇
Day-11 讀萬卷書,不如刷YT Video Highlight、Video Summary、Video Captions
系列文
ChatGPT!啟動!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言